~~
東京工業大と富士通などは22日、スーパーコンピューター「富岳」を使って、生成人工知能(AI)の基盤技術を開発すると発表した。国産の生成AIの開発や国内のAI関連技術の向上、国際競争力強化につなげる狙いがある。日本語の文章データを中心に学習させた技術を23年度中に構築し、24年度に国内企業や大学などに無償で提供することを目指す。
米オープンAIが開発した対話型AIの「チャットGPT」をはじめとする生成AIは、大量のデータから学習して画像や文章などを生成する。チャットGPTなどでは、AIの学習に英語の文章データが多く使われているとされ、日本語での質問や日本の話題については、回答の精度が低く、誤った回答を示すことが多い課題があった。
そこで東工大などのチームは、日本語の文章データを中心に使って生成AIの基盤となる「大規模言語モデル」を開発する。インターネット上に公開されている日本語のニュース記事やブログ記事、オンライン百科事典の「ウィキペディア」などの文章データでAIを学習させる。開発には、富岳を運用する理化学研究所や東北大も参加。名古屋大やIT大手サイバーエージェントとの連携も検討する。
チームの坂口慶祐・東北大准教授(情報科学)は、「チャットGPTなど米国の技術に依存しすぎると、日本だけでは何もできなくなってしまう。(AI開発の)ノウハウや知見をため、日本独自に作れる技術を持っていくことが重要だ」と指摘した。